Chapitre 2 - Statistiques

  • Représenter graphiquement un nuage de points et son soint moyen
  • Droite d'ajustement, méthode graphique

IStatistiques à deux variables

1Généralités

Nous étudions des séries statistiques à deux variables lorsque l'on étudie deux données numériques différentes sur une population.
Nous étudions une "population" de 5 élèves et observons leurs moyennes sur l'année de seconde et aussi sur l'année de première : $$ \begin{array}{|l|c|c|c|c|c|} \hline \text{Elève} & A & B & C & D & E \\ \hline \text{Moyenne en seconde} & 11 & 14 & 9 & 12 & 13 \\ \hline \text{Moyenne en première} & 12 & 12 & 10 & 13 & 10 \\ \hline \end{array} $$

Une série statistique à deux variables \(x\) et \(y\) est un ensemble de \(N\) couples \((x_1;y_1)\), \((x_2;y_2)\), \(\dots\), \((x_N;y_N)\), de valeurs observées sur deux caractères d'une même population.

Les séries statistiques à deux variables sont généralement données sous forme d'un tableau à double entrée : $$ \begin{array}{|l|c|c|c|c|} \hline \text{individus} & 1 & 2 & ... & N \\ \hline \text{Caractère } x & x_1 & x_2 & ... & x_N \\ \hline \text{Caractère } y & y_1 & y_2 & ... & y_N \\ \hline \end{array} $$

2Nuages de points

Une série statistiques à deux variables (\(x;y)\) peut être représentée graphiquement par un nuage de points :
  • On se place dans un repère adapté
  • Le premier caractère \(x\) est représenté sur l\'axe des abscisses
  • Le deuxième caractère \(y\) est représenté sur l\'axe des ordonnées
Ainsi, chaque couple de valeurs \((x_i;y_i)\) est représenté par un point de coordonnées \((x_i;y_i)\).
On note \(\bar{x}\) la moyenne des valeurs \(x_i\) et \(\bar{y}\) la moyenne des valeurs \(y_i\) : $$\bar{x} = \frac{x_1 + x_2 + ... + x_N}{N} \ \ \ \ \ \bar{y} = \frac{y_1 + y_2 + ... + y_N}{N}$$ Le point \(G\) de coordonnées \((\bar{x};\bar{y})\) est appelé le point moyen de la série.
En reprenant l'exemple précédents des notes de seconde et de première, on obtient \(5\) points \(A,B,C,D,E\) pour chaque élève, et le point moyen \(G\) :
$$ \begin{array}{|l|c|c|c|c|c|} \hline \text{Elève} & A & B & C & D & E \\ \hline \text{Moyenne en seconde} & 11 & 14 & 9 & 12 & 13 \\ \hline \text{Moyenne en première} & 12 & 12 & 10 & 13 & 10 \\ \hline \end{array} $$
Calcul du point moyen : $$ \begin{array}{lllll} \bar{x}&=&\frac{11+14+9+12+13}{5} &=& 11,8 \\ \bar{y}&=&\frac{12+12+10+13+10}{5} &=& 11,4 \end{array} \\ \\ $$ Le point milieu à pour coordonnées \(G (11,8 ; 11,4)\).
Le point moyen se situe toujours "au centre" du nuage de point car il représente la tendance moyenne.

IIAjustement linéaire

Effectuer un ajustement sur un nuage de point consiste à utiliser une courbe approximante.
Lorsque les points sont à peu prêt alignés, on peut faire un ajustement par une droite. On dit qu'on a réalisé un ajustement affine
Si les points ne sont pas suffisement alignés, il n'est pas possible de faire un ajustement affine pertinent
Lorsque l'on peut réaliser un ajustement affine, la meilleure droite d'ajustement passe par le point moyen (voir figure ci-dessus).